# pip install wheel
# pip install pywin32
# pip install scrapy
# scrapy startproject firstBlood
# cd firstBlood/
# scrapy genspider first www.xxx.com
# scrapy crawl first
# scrapy crawl first --nolog
import scrapy


class FirstSpider(scrapy.Spider):
    # 爬虫文件的名称：就是爬虫源文件的一个唯一标识
    name = "first"
    # 允许的域名：用来限定start_urls列表中哪些url可以进行请求发送
    # allowed_domains = ["www.xxx.com"]

    # 起始的url列表：该列表中存放的url会被scrapy自动进行请求的发送
    start_urls = ["https://www.baidu.com", "https://www.sogou.com"]

    # 用作于数据解析：response参数表示的就是请求成功后对应的响应对象
    def parse(self, response):
        print(response)
